资源介绍
分词和分类检索平台
- 导入文本即可自动分词不用安装软件,直接在界面里导入文本数据,即可自动分词,可下载到词频表和分词效果表;
- 特征词选择,构建专题词库提供词性、词频、过滤等多种筛选条件,可结合样本数据查看,让您能快速找到有用的特征词,完成后即可下载到选词结果表、特征词与原文的匹配表;
- 一键情感分析,情感词典可定义自带情感词典,也支持自定义词典,一键开启情感分析,自动切分句子,计算出语句级情感倾向,可下载到情感分析表。
- 自定义标签词匹配,一键实现文本分类按标签词与文本匹配算法,实现自动文本分类,支持自定义标签词,一键开启文本分类匹配,可下载到分类结果表。
- 与Python文本挖掘结合,扩展文本分析能力利用Python的文本挖掘程序库和机器学习程序库,跟集搜客数据管家软件集成,已实现的拓展功能包括:文本聚类分析、LDA话题分析(多个话题分析模型可选)。陆续还会有更多的扩展功能发布给大家
操作说明
1. 登录进入系统,点击【新建任务】,导入要做分词处理或者是要分析的数据文件。
2. 筛选词语,切词会按词频从大到小排序,可按词性、过滤条件来筛选,再结合样本数据查看,让您快捷地选出需要的特征词,每一页选完点击【确定】提交就会切换到下一页。

3. 如果需要补充词语,可以直接点【添加词语】来补充,或者回到筛选词语那里再次选择。 点击【生成词云图】即可一键获取词云图。

4. 通过自定义分类标签词,一键启动分类匹配,即可在“分类检索”的“关注”里查看和下载分类结果。


5. 支持自定义情感词典,一键启动情感分析,即可查看和下载情感分析结果。

6.1 最后下载数据,在“分词选词”菜单里,点击【下载】按钮,可以下载到词频表、分词效果表、选词结果表、打标结果表这4张表;还可以【下载匹配矩阵表】、【下载分词效果表】。
(1)词频表

(2)分词效果表

(3)选词结果表

(4)打标结果表

(5)匹配矩阵表

(6)打标匹配表

(7)社会网络关系表

(2)分词效果表

(3)选词结果表

(4)打标结果表

(5)匹配矩阵表

(6)打标匹配表

(7)社会网络关系表

6.2 在“分类检索”菜单的“关注”里,如果有分类的话,下载就能得到【分类数据表】。
(8)分类数据表

6.3 在“情感分析”菜单,匹配情感分析后,可下载到【情感分析表】。
(9)情感分析表

应用举例
一条条文本变成对应于每个特征词的矩阵,就能用量化计算对文本内容进行分析。例如,对消费者对手机使用体验的评论信息进行分词打标,得到这样一个矩阵
针对这样的数据表,通过统计运算和数据挖掘运算,可以得出很多量化的结论。


用户评论
评分:
